Nesta seção, são apresentados os resultados da análise da taxa de desemprego mensal na Alemanha, no período de 1994 a 2016. Como os dados estão expressos em porcentagem, foi necessário convertê-los para proporções, dividindo os valores por 100. A série contém um total de 272 observações, obtidas por meio do sistema de gerenciamento de séries temporais do Banco Central do Brasil.
Abaixo temos uma descritiva dos valores da série e também seu Box-plot, podemos notar que não há presença de outliers.
summary(serie_desemprego)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.04300 0.06625 0.08200 0.07887 0.09375 0.11200
A Figura a seguir exibe a série temporal da taxa de desemprego mensal na Alemanha no período de 1994 a 2016. Verifica-se uma tendência de aumento na taxa de desemprego entre 2002 e 2005, atingindo seu pico nesse intervalo. A partir de 2006, observa-se um movimento de queda contínua, o qual se mantém até o término do período analisado, indicando uma possível recuperação sustentada do mercado de trabalho alemão.
Por conseguinte, temos a decomposição da série para tedência e
sazonalidade:
A avaliação da estacionariedade da série foi conduzida por meio de testes de raiz unitária, conforme apresentado na Tabela 1. Os testes de Augmented Dickey-Fuller (ADF) e Phillips-Perron (PP) não rejeitaram a hipótese nula de presença de tendência estocástica (p-valores de 0.5579 e 0.9630, respectivamente), sugerindo que a série possui raiz unitária. No entanto, o teste KPSS para nível, cuja hipótese nula é de estacionariedade em torno de uma média constante, foi rejeitado (p-valor = 0.0100), corroborando a evidência de não estacionariedade. Esse conjunto de resultados indica a presença de uma tendência estocástica na série.
A Tabela 2 apresenta os resultados dos testes para identificação de tendência determinística. Todos os testes aplicados (Cox-Stuart, Cox and Stuart Trend, Mann-Kendall, Mann-Kendall Trend e KPSS para tendência) rejeitaram a hipótese nula de ausência de tendência (p-valores ≤ 0.01), indicando de forma consistente a presença de uma tendência determinística ao longo do tempo.
Por fim, a Tabela 3 resume os resultados dos testes de sazonalidade. O teste de Kruskal-Wallis não rejeitou a hipótese nula de ausência de sazonalidade (p-valor = 1.0000), enquanto o teste de Friedman detectou evidência de sazonalidade significativa (p-valor = 0.0181). Assim, embora haja alguma indicação de componente sazonal, os resultados são inconclusivos e sugerem que, se presente, a sazonalidade não é fortemente expressiva.
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Augmented Dickey-Fuller | Tendencia | 0.5579 | Tendencia |
| Phillips-Perron Unit Root | Tendencia | 0.9630 | Tendencia |
| KPSS Test for Level | NAO tendencia | 0.0100 | Tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Cox Stuart | NAO tendencia | 0.00 | Tendencia |
| Cox and Stuart Trend | NAO tendencia | 0.00 | Tendencia |
| Mann-Kendall Trend | NAO tendencia | 0.00 | Tendencia |
| Mann-Kendall | NAO tendencia | 0.00 | Tendencia |
| KPSS Test for Trend | NAO tendencia | 0.01 | Tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Kruskall Wallis | NAO Sazonal | 1.0000 | NAO Sazonal |
| Friedman rank | NAO Sazonal | 0.0181 | Sazonal |
Para investigar a presença de dependência de longo prazo na série temporal da taxa de desemprego, estimou-se o expoente de Hurst por diferentes métodos. Conforme apresentado, a estimativa simples baseada no método R/S (rescaled range) resultou em um valor de 0.8373, enquanto a versão corrigida apresentou um valor ainda mais elevado, de 0.9856. Já o expoente de Hurst empírico foi estimado em 0.8267, com a versão corrigida indicando 0.7992. Todos os valores obtidos são significativamente superiores a 0,5, o que evidencia forte persistência temporal na série. Isso implica que choques passados tendem a ter efeitos prolongados ao longo do tempo, o que é característico de processos com memória longa.
Adicionalmente, foi estimado o parâmetro de diferenciação fracionária d , com valor de 1.1003, indicando que a série é fracamente não estacionária e apresenta memória longa, uma vez que \(0.5<d<1.5\). As estimativas do desvio padrão associado, obtidas via aproximação assintótica e via regressão, foram de 0.2102 e 0.1232, respectivamente, reforçando a robustez da estimação de d.
Esses resultados sugerem que, para a modelagem adequada da série, é necessário considerar abordagens que capturem a estrutura de longa dependência, como modelos ARFIMA.
## Simple R/S Hurst estimation: 0.8372923
## Corrected R over S Hurst exponent: 0.9855974
## Empirical Hurst exponent: 0.8267286
## Corrected empirical Hurst exponent: 0.799164
## Theoretical Hurst exponent: 0.5538539
## $d
## [1] 1.100285
##
## $sd.as
## [1] 0.2102335
##
## $sd.reg
## [1] 0.1231577
Por fim, foi considerado um modelo ARFIMA(2, 1, 0), ou seja, dois coeficientes autoregressivos e uma diferenciação. Sendo os valores estimados dos parâmetros significativos, a 5% são: \(\phi_{1}=0.48, \phi_{2}=0.45, \text{fractional differencing}=-0.26\). Além disso temos, \(\text{AIC}=-3775.07, \text{BIC}=-3757.3\). Vale ressaltar que um valor negativo para fractional differencing não é o mais adequado.
A Figura apresenta os diagnósticos dos resíduos do modelo ajustado. O gráfico superior exibe a série dos resíduos ao longo do tempo, os quais oscilam em torno de zero sem apresentar padrões sistemáticos visíveis, sugerindo ausência de estrutura temporal remanescente. A análise da função de autocorrelação (ACF), apresentada no gráfico inferior esquerdo, demonstra que os resíduos não apresentam autocorrelação significativa até a defasagem 25, uma vez que a maioria dos coeficientes está contida dentro dos limites de confiança. A normalidade dos resíduos foi avaliada por meio do histograma com sobreposição de uma curva de densidade normal (gráfico inferior direito). A distribuição dos resíduos aproxima-se de uma distribuição normal, com leve assimetria, porém sem evidências visuais de desvios em escala.
Por fim, foi realizado o teste de Ljung-Box para avaliar a independência dos resíduos. O valor do estatístico \(Q∗=9,5962\) com 10 graus de liberdade resultou em um p-valor de 0,4766. Dessa forma, não se rejeita a hipótese nula de ausência de autocorrelação nos resíduos até a defasagem 10, indicando que os resíduos podem ser considerados independentes ao longo do tempo.
forecast::checkresiduals(resid$Mode1)
##
## Ljung-Box test
##
## data: Residuals
## Q* = 9.5962, df = 10, p-value = 0.4766
##
## Model df: 0. Total lags used: 10
Nas imagens abaixo temos acf e pacf dos resíduos do modelo ajustado.
Por fim, a Figura abaixo apresenta os valores preditos para os próximos
12 períodos, com base no modelo ajustado à série temporal. A linha em
cinza representa a previsão pontual (Exact prediction), enquanto as
faixas tracejadas indicam os intervalos de predição com 95% de
confiança. O intervalo tracejado em vermelho corresponde ao intervalo de
predição exato (Exact 95% PI), enquanto o intervalo tracejado em laranja
refere-se ao intervalo assintótico (Limiting 95% PI), o qual se alarga
com o aumento do horizonte de previsão, refletindo o crescimento da
incerteza associada às estimativas futuras.
O ouro é um ativo financeiro para exportação, investimentos de longo prazo, consumo industrial e câmbio de moedas estrangeiras. Segundo The Gold Bullion Company, o Brasil ocupa o 7° lugar no balanço mundial de oferta e demanda de ouro, com este contexto foi feito uma análise da série histórica do preço de comercialização diária do ouro(em quilogramas) entre os anos de 2013 a 2023. O Dataset utilizado pode ser acesso neste link do Kaggle Gold Price Prediction. Os dados foram agrupados mensalmente, e ao todo temos 120 observações, o que representaria 120 meses.
summary(serie_gold_price)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1069 1244 1321 1440 1711 1972
A Figura a seguir apresenta a série temporal dos preços mensais do ouro no período de 2013 a 2023. A partir de uma análise visual preliminar, não se observa evidência clara de sazonalidade na série. Destaca-se, entretanto, um aumento expressivo nos preços entre os anos de 2019 e 2021.
Temos também a decomposição da série para tendência e sazonalidade na Figura abaixo:
Conforme os resultados apresentados na Tabela 1, os testes de raiz
unitária indicam a presença de uma tendência estocástica na série. Tanto
o teste de Augmented Dickey-Fuller (ADF) quanto o teste de
Phillips-Perron não rejeitam a hipótese nula de presença de raiz
unitária (p-valores de 0.3553 e 0.5252, respectivamente), sugerindo que
a série não é estacionária. Por outro lado, o teste KPSS rejeita a
hipótese nula de estacionariedade em torno de uma média constante
(p-valor = 0.0100), reforçando a conclusão de não estacionariedade e
indicando a presença de uma tendência. A Tabela 2 apresenta os
resultados dos testes para identificação de tendência determinística.
Todos os testes aplicados, incluindo Cox-Stuart, Mann-Kendall e KPSS
para tendência, rejeitaram a hipótese nula de ausência de tendência com
p-valores inferiores a 0.01. Esse conjunto de evidências confirma a
existência de uma tendência determinística significativa ao longo do
tempo, o que é compatível com a trajetória ascendente observada na
série, especialmente a partir de 2019.
A análise de sazonalidade, sumarizada na Tabela 3, foi conduzida por meio dos testes de Kruskal-Wallis e Friedman rank. Em ambos os casos, os p-valores elevados (0.9991 e 0.8554, respectivamente) indicam que não há evidência estatística para rejeitar a hipótese nula de ausência de sazonalidade. Assim, conclui-se que a série não apresenta comportamento sazonal recorrente. Em conjunto, os resultados apontam que a série é não estacionária, possui uma tendência determinística significativa e não apresenta componentes sazonais, o que deve ser considerado na escolha e especificação de modelos de previsão adequados.
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Augmented Dickey-Fuller | Tendencia | 0.3553 | Tendencia |
| Phillips-Perron Unit Root | Tendencia | 0.5252 | Tendencia |
| KPSS Test for Level | NAO tendencia | 0.0100 | Tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Cox Stuart | NAO tendencia | 0.00 | Tendencia |
| Cox and Stuart Trend | NAO tendencia | 0.00 | Tendencia |
| Mann-Kendall Trend | NAO tendencia | 0.00 | Tendencia |
| Mann-Kendall | NAO tendencia | 0.00 | Tendencia |
| KPSS Test for Trend | NAO tendencia | 0.01 | Tendencia |
| Testes | H0 | p_valor | Conclusao |
|---|---|---|---|
| Kruskall Wallis | NAO Sazonal | 0.9991 | NAO Sazonal |
| Friedman rank | NAO Sazonal | 0.8554 | NAO Sazonal |
Após a tentativa de ajuste dos modelos clássicos como ARMA, ARIMA e SARIMA, os quais não performaram de maneira adequada, optou-se por desenvolver um modelo de no qual se utiliza séries temporais.
A Tabela 4 apresenta os resultados das métricas de avaliação do modelo ajustado à série temporal de preços mensais do ouro, considerando os conjuntos de treinamento e teste. As métricas utilizadas incluem o erro médio (ME), a raiz do erro quadrático médio (RMSE), o erro absoluto médio (MAE) e o erro percentual absoluto médio (MAPE).
No conjunto de treinamento, o modelo apresentou desempenho satisfatório, com erro médio próximo de zero (ME = -0.0021), o que indica ausência de viés sistemático nas previsões. O RMSE de 38.17 e o MAE de 29.50 indicam que os erros de previsão, em média, são relativamente baixos, considerando a escala dos dados. O MAPE de 2.16% reforça essa avaliação, sinalizando boa acurácia relativa das previsões no período de ajuste.
No entanto, ao se analisar o desempenho no conjunto de teste, observa-se um aumento significativo nos erros. O erro médio passou a 3.23, indicando leve superestimação sistemática. O RMSE e o MAE aumentaram para 86.83 e 73.11, respectivamente, sugerindo maior variabilidade e magnitude dos erros. O MAPE alcançou 4.05%, valor ainda aceitável, mas que indica uma queda na precisão relativa do modelo fora da amostra.
Esses resultados sugerem que, embora o modelo apresente bom ajuste aos dados históricos, seu desempenho preditivo fora da amostra é sensivelmente inferior, o que pode estar relacionado a mudanças estruturais recentes na série ou à presença de eventos atípicos. Assim, a reavaliação da estrutura do modelo, bem como o uso de abordagens mais robustas ou modelos com capacidade adaptativa, pode ser recomendada para melhorar a capacidade preditiva.
| ME | RMSE | MAE | MAPE | |
|---|---|---|---|---|
| Training set | -0.0450483 | 38.25433 | 29.53629 | 2.159379 |
| Test set | 3.6810852 | 86.79897 | 73.16821 | 4.054003 |
A Figura apresenta os diagnósticos dos resíduos do modelo ajustado à série temporal de preços do ouro. O painel superior exibe o gráfico da série residual ao longo do tempo, o qual não indica a presença de padrões sistemáticos ou comportamento estrutural, sugerindo que os resíduos se comportam como ruído branco. A análise da função de autocorrelação dos resíduos (ACF), mostrada no painel inferior esquerdo, demonstra que a maioria dos coeficientes de autocorrelação até a defasagem 36 encontra-se dentro dos limites de confiança de 95% (linhas tracejadas azuis), indicando ausência de autocorrelação significativa nas defasagens avaliadas. O histograma dos resíduos, no painel inferior direito, mostra uma distribuição aproximadamente simétrica em torno de zero, com leve curtose e presença de poucos valores extremos. A curva de densidade ajustada reforça essa proximidade com a distribuição normal, embora pequenas assimetrias possam ser observadas. Adicionalmente, o teste de Ljung-Box foi aplicado para avaliar a hipótese de ausência de autocorrelação nos resíduos até a defasagem 22. O valor do estatístico foi 𝑄∗=17,917, com 22 graus de liberdade e p-valor de 0{,}7109. Como o p-valor é elevado, não se rejeita a hipótese nula de que os resíduos são independentes. Isso reforça a adequação do modelo ajustado, do ponto de vista da estrutura de dependência serial dos resíduos. Em conjunto, os resultados indicam que os resíduos do modelo apresentam comportamento satisfatório, compatível com as suposições de normalidade e ausência de autocorrelação, o que contribui para a validade das inferências e previsões derivadas do modelo.
checkresiduals(fit_netar$residuals)
##
## Ljung-Box test
##
## data: Residuals
## Q* = 18.609, df = 22, p-value = 0.6694
##
## Model df: 0. Total lags used: 22
Por fim, foram gerados os gráficos de previsão que se encontram abaixo.